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0. Introduction. 


Le texte qui suit a pour but d’expliciter, sur l’exemple de la géométrie affine 
du collège (Thalès, médianes, etc.), certaines des conceptions mathématiques et 
épistémologiques qui sous-tendent le rapport d’étape de la commission de réflexion 
sur l’enseignement des mathématiques (commission Kahane). 


L'un des points de départ de notre réflexion est la citation suivante de Bourbaki 
(cf. [Bo] p. 142) sur la géométrie “élémentaire” : 

Mais la situation devient bien plus nette avec les progrès de la théorie des 
invariants [...] qui marque la mort, comme champ de recherches, de la théorie 
classique des invariants elle-même et de la géométrie “élémentaire”, qui en est 
devenue pratiquement un simple dictionnaire. Sans doute, rien ne permet de 
prévoir a priori, parmi l’infinité de théorèmes que l’on peut ainsi dérouler à 
volonté, quels seront ceux dont l’énoncé, dans un langage géométrique approprié, 
aura une simplicité et une élégance comparables aux résultats classiques, et il 
reste là un domaine restreint où continuent à s'exercer avec bonheur de nombreux 
amateurs (géométrie du triangle, du tétraèdre, des courbes et surfaces algébriques 
de bas degré, etc.) Mais pour le mathématicien professionnel, la mine est tarie … 


Cette phrase est intéressante à un double titre, au point de vue mathématique 
d’abord, mais aussi à cause des conséquences que cette position a pu avoir sur 
l’enseignement de la géométrie. En effet, cette prise de position de Bourbaki, 
que l’on peut considérer comme emblématique des mathématiciens de l’époque, 
a joué un rôle important dans la réforme des mathématiques modernes à la fin des 
années 60. Le discours était en gros le suivant : puisque la géométrie élémentaire est 
morte, mieux vaut enseigner autre chose, les espaces vectoriels, les transformations, 
l'analyse... On relira à ce sujet l’introduction de Jean Dieudonné dans [D|. 

Bien sûr, avec le recul, tout le monde s'accorde à dire que la réforme des 
mathématiques modernes à été un échec. Bien sûr, on y trouve facilement de 
multiples raisons du côté de la formation des maîtres ainsi que de nombreuses 
raisons didactiques. Ces raisons, pour importantes qu’elles soient, ne nous ont pas 
paru totalement satisfaisantes et nous avons cherché à comprendre s’il n’y avait 
pas aussi de bonnes raisons mathématiques et épistémologiques à cet échec de 
la réforme. Ces idées ont été développées dans la deuxième partie du rapport en 


une analyse de la réforme des mathématiques modernes qui s’articule autour de la 
critique de cinq points : 


e Le projet du “tout linéaire”. 
e La minoration systématique du rôle des figures. 


e La minoration du rôle des invariants, notamment aire et angle. 
e L'’abandon des cas d'égalité des triangles. 


e La disparition des géométries riches. 


Nous allons parler ici du troisième point (le rôle des invariants, et notamment 
de l’aire), en reprenant avec plus de détails le contenu de l’annexe 1 du rapport. 
Si nous avons choisi la notion d’aire c’est parce qu’elle est un peu la mal aimée 
de notre enseignement. Elle allie pourtant de nombreux avantages : elle est très 
intuitive, c’est un excellent outil de démonstration et enfin, et c’est ce que nous 
voudrions montrer ici, son utilisation est tout à fait justifiée par la théorie. Une 
autre raison de ce choix c’est que la théorie, dans le cas de la géométrie affine du 
triangle, est particulièrement simple. Bien entendu, on peut mener une réflexion 
assez voisine dans le cas de la géométrie euclidienne avec les invariants longueur 
et angle. 


Attention, le plaidoyer développé ci-dessous en faveur de la notion d’aire ne 
signifie évidemment pas que les autres outils disponibles actuellement au collège, 
et notamment les transformations, aient perdu de leur importance. L'objectif à 
poursuivre est plutôt de trouver un nouvel équilibre entre divers points de vue. 


1. Le programme d’Erlangen et les invariants. 


a) Le programme d’Erlangen. 


Il s’agit de la thèse de Felix Klein soutenue à Erlangen en 1872. C’est un texte qui 
a inspiré nombre de promoteurs de la réforme des mathématiques modernes. 

Le travail de Klein se veut une unification de toutes les géométries que le dix- 
neuvième siècle a vu éclore, à côté de la géométrie euclidienne classique : géométries 
projective, anallagmatique (la géométrie de l’inversion), non euclidiennes, etc. Sa 
thèse est qu’une géométrie consiste, pour l’essentiel, en la donnée d’un ensemble 
X et d’un groupe G de transformations de X. Les éléments de G sont les 
transformations “permises” dans la géométrie en question et ils caractérisent cette 
géométrie. Il s’agit, par exemple, des transformations affines pour la géométrie 
affine plane, ou des isométries affines pour la géométrie euclidienne plane ou 
encore des homographies pour la géométrie projective. Les propriétés relatives 
à la géométrie en question (propriétés affines, euclidiennes, projectives) sont celles 
qui sont conservées dans l’action du groupe, ainsi que le dit Klein (cf. [K] p.7) : 
“Étant donnés une multiplicité et un groupe de transformations de cette multi- 
plicité, en étudier les êtres au point de vue des propriétés qui ne sont pas altérées 
par les transformations du groupe.” 

Par exemple, pour citer trois résultats célèbres, Pappus, qui n’emploie que les 
notions de concourance et d’alignement, est un théorème projectif tandis que 
Thalès, qui utilise des parallèles, est un résultat affine et Pythagore, qui met 
en jeu longueurs et orthogonalité, est un théorème euclidien. On peut dire, en 


de) 
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quelque sorte, que chaque théorème possède une niche écologique privilégiée, qui 
correspond au cadre dans lequel il s’énonce avec le plus de généralité. 


b) Erlangen et les invariants. 


Lorsqu'on lit Klein avec les yeux d’un mathématicien actuel on ne peut qu’être 
en accord avec ce qu'il écrit, mais on reste un peu sur sa faim : si le groupe des 
transformations permises indique bien dans quel type de géométrie on travaille, il 
ne dit pas comment obtenir les théorèmes de cette géométrie. En fait, ce problème 
est résolu au moyen de la théorie des invariants (à peu près contemporaine de 
Klein). C’est à cela que Bourbaki fait allusion. Notre opinion est que cette théorie 
est inséparable du programme d’Erlangen et, pour utiliser une image familière, 
que le programme d’Erlangen sans la théorie des invariants c’est comme un vélo 
sans pédales. D'ailleurs, Klein lui-même assigne à la géométrie l’ objectif suivant : 
on donne une multiplicité et un groupe de transformations de cette multiplicité ; 
développer la théorie des invariants relatifs à ce groupe. 


c) Les invariants, version naïve. 


Considérons d’abord les invariants en un sens intuitif. Il s’agit simplement alors 
des notions qui sont conservées par les transformations du groupe en question. Par 
exemple, dans le cas de la géométrie euclidienne les invariants les plus immédiats 
sont les notions usuelles de longueur, d’orthogonalité ou plus généralement d’angle. 


Dans le cas de la géométrie affine qui va surtout nous intéresser ici, longueur et 
d'angle ne sont plus des invariants, comme on le voit sur l’exemple de l’affinité 
(1). On dispose cependant d’un semi-invariant qui est l’aire, par exemple celle 
des triangles. En effet, même si on définit souvent l’aire à partir d’une structure 
euclidienne (penser à la formule base x hauteur / 2), l’aire est en réalité une notion 
affine.(?) Nous le verrons abondamment dans ce qui suit, mais il suffit pour 
s’en convaincre de penser à la transformation qui consiste à déplacer le sommet 
d’un triangle sur une parallèle à la base, transformation qui n’est certes pas une 
isométrie, mais qui conserve pourtant l’aire. 

Nous disons que l’aire est un semi-invariant seulement car si u est une transfor- 
mation affine quelconque (penser à une affinité ou une homothétie), l’aire n’est 
pas conservée, mais multipliée par le déterminant de l’application linéaire associée 
comme nous le verrons au paragraphe 3 ci-dessous. Toutefois c’est un vrai invari- 
ant pour les transformations affines de déterminant 1 et, même dans le cas des 
transformations affines générales, les rapports d’aires, eux, sont conservés. (*) 


d) Invariants naïfs et théorèmes. 


L'une des critiques essentielles que l’on peut faire à la réforme des mathématiques 
modernes est d’avoir minoré l’importance des invariants. Dans le cas de la 
géométrie euclidienne (resp. affine) cela a conduit à négliger un peu trop la 


Rappelons que l’affinité (ou dilatation) d’axe Ox, de direction Oy et de rapport 
À, est la transformation qui au point de coordonnées (x, y) associe (x, Ày). 
D'ailleurs, toute la construction d’une mesure des aires telle que la pratique par 
exemple Henri Lebesgue dans [L] peut être faite sans la structure euclidienne en 
prenant un parallélogramme comme unité au lieu d’un carré. 

On voit apparaître ici les rapports de grandeurs chers aux grecs. 


notion d’angle (resp. la notion d’aire), au profit d’un usage quasi exclusif des 
transformations. 

Nous allons essayer de montrer sur l’exemple de la géométrie affine que l’usage 
des invariants est pourtant une méthode parfaitement pertinente en montrant au 
paragraphe 2 comment un petit nombre de lemmes qu’on peut enseigner au collège 
permettent de prouver une grande quantité de résultats de géométrie affine. Cette 
constatation empirique, que nombre de professeurs ont d’ailleurs faite avant nous, 
sera justifiée par la théorie au paragraphe 3 où nous expliquerons que l’aire est, en 
fait, le seul invariant de la géométrie affine du triangle, et que tous les théorèmes 
de géométrie affine (et c’est aussi le cas des autres géométries) découlent de la 
connaissance des invariants et des relations qui les lient. 


2. L’invariant aire et la géométrie du collège. 


Dans ce paragraphe nous travaillerons dans un plan affine (que l’on pourra 
supposer euclidien, encore que cette dernière condition ne soit pas vraiment 
nécessaire). Le lecteur pourra, au choix, penser ce plan comme défini à l’aide d’une 
axiomatique du type de celle d’'Euclide (points, droites, parallèles, etc.) ou à l’aide 
de la notion d’espace vectoriel. On sait depuis Hilbert que ces deux approches sont, 
en fait, équivalentes. Nous noterons les points avec des lettres minuscules, préférant 
réserver l’usage des majuscules aux parties du plan. Le lecteur nous pardonnera 
cette entorse à l’usage de l’enseignement secondaire, car elle lui facilitera peut-être 
la lecture du paragraphe 3. 


Nous aurons évidemment besoin de la notion d’aire d’une partie E du plan (que 
nous noterons A(ÆE)), dont nous utiliserons de manière essentielle deux propriétés : 
1) Additivité. 

Si À et B sont deux parties disjointes du plan, on à A(AU B) = A(A) + A(B). 
2) Invariance par déplacement. 

Si u est un déplacement on a A{u(E)) = A(E). 


Ces deux propriétés peuvent se résumer en disant que l’aire est invariante par 
découpage et recollement. En fait, nous utiliserons aussi la propriété 1) sous une 
forme plus forte, dans le cas où les parties À et B ont en commun un ou plusieurs 
segments (c’est légitime car ceux-ci sont d’aire nulle). De plus, nous verrons au 
8g) qu’on peut se limiter à n’utiliser de la propriété 2) que l’invariance par un seul 
type de déplacement : la symétrie centrale. 


Outre ces propriétés, nous utiliserons quelques notions d'ordre (par exemple 
l’axiome de Pasch qui dit qu’une droite qui coupe un côté d’un triangle et qui 
ne passe pas par un sommet en coupe exactement un autre) et la notion de 
rapports de mesures algébriques sur une droite donnée. En termes modernes, cette 
notion ne fait que traduire la bijection des droites affines avec R. Nous attirons 
l’attention du lecteur sur le fait qu’il s’agit là d’une notion affine, puisque toutes 
les transformations affines conservent ces rapports, même si elles ne conservent 
pas les distances (considérer par exemple le cas de l’affinité). 


a) Les quatre lemmes du collège. 


Il s’agit des quatre lemmes suivants, dont nous verrons au paragraphe 3, qu’ils 
ne font que traduire la semi-invariance de l’aire par certaines transformations du 
groupe affine. 
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e Le premier est le lemme “du demi-parallélogramme” qui dit que chaque diagonale 
partage un parallélogramme en deux triangles de même aire. 
C’est une conséquence de l’invariance de l’aire par symétrie centrale. 


e Le second est le lemme “du trapèze” qui dit que deux triangles qui ont même 
base et des sommets sur une parallèle à la base sont d’aires égales. 


e Le troisième est le lemme “de la médiane” qui affirme qu’une médiane partage 
un triangle en deux triangles d’aires égales. 


e Le quatrième est le lemme “des proportions” qui dit que si deux triangles ont 
un sommet commun b et des bases ac et ac” portées par la même droite, le rapport 
de leurs aires est égal au rapport des bases. Bien entendu le troisième lemme en 
est un cas particulier. 


Ces lemmes, au niveau du collège, peuvent se montrer de manière évidente avec la 
formule base x hauteur /2, (*) ou, mieux encore, par découpage à partir du lemme 
du demi-parallélogramme, voir 89). 


b) Application 1 : Thalès. 


Nous allons voir que les quatre lemmes ci-dessus permettent de montrer une 
quantité de résultats de géométrie affine du triangle. En fait, et c’est ce que nous 
expliquerons au paragraphe 3, ce qu’affirme la théorie des invariants, c’est que tous 
les théorèmes affines du triangle peuvent se montrer avec ces lemmes. 
Commençons par une preuve du théorème de Thalès : 


Soit abc un triangle. Soient b' € [ab] et c’ € [ac]. On supppose (b’c') parallèle à 
(bc). On a alors Lu = ee 
ba ca 
En effet, on a A(bcc') — A(bcb') par le lemme du trapèze et donc 


par le lemme des proportions. 


En fait, cette preuve n’est autre que celle d'Euclide et il est piquant (et instructif) 
que la preuve la plus fidèle, par l’usage qu’elle fait des invariants, à l’esprit 
d’Erlangen (du moins tel que nous le comprenons et, en tous cas, comme Bourbaki 
le formule dans le texte cité ci-dessus) soit celle d’'Euclide et pas la preuve via les 
vecteurs, ni celles via les homothéties ou les projections, seules preuves admises 
au temps des mathématiques modernes. Entendons-nous bien. Nous n’avons rien 
contre ces preuves qui sont tout à fait satisfaisantes et qui ont d’autres avantages 
(notamment de préparer à la prise en compte du fait linéaire). Nous disons 
simplement que celle proposée ici a, pour le collège, l’avantage de l’économie des 
moyens puisqu'elle n'utilise que la notion d’aire. 


c) Application 2 : médianes. 


Bien que toutes ces notions soient affines et pas euclidiennes, ce n’est évidemment 
pas une raison pour se priver des outils euclidiens dans l’enseignement. 


Une deuxième application des principes évoqués ci-dessus est la preuve de la con- 
courance des médianes d’un triangle. On montre d’abord qu’un point o (intérieur 
au triangle) est sur la médiane aa” du triangle abc si et seulement si on a l'égalité 
des aires A(oab) — A(oac). En effet, pour le sens direct on applique deux fois le 
lemme de la médiane ; pour la réciproque on utilise le lemme suivant, variante 
immédiate du lemme des proportions, que nous appellerons “lemme du chevron” 
dans ce qui suit (un dessin explique ce nom si o est un point intérieur du triangle) : 


Soit abc un triangle et o un point du plan. Si (oa) coupe (bc) en a’, on a la formule 


A(oba) _ a'b 


A(oca) ac 


Revenons à la concourance des médianes. Si on note aa’, bb',cc! les médianes et 
g le point d’intersection de (bb') et (cc') on à alors, par le lemme du chevron 
A(gab) = A(gbc) et A(gbc) = A(gac), d’où A(gab) = A(gac) et le résultat. 

d) Application 3 : Ménélaüs. 

Rappelons l’énoncé de ce théorème : 


Soit abc un triangle et soit D une droite qui coupe respectivement les droites 
(bc), (ca), (ab) en a/,b',c!. On a l'égalité 


ab  b'e c'a 


x x _ 
ac bla cb 


Il y a deux cas de figures (et deux seulement en vertu de l’axiome de Pasch) : soit 
deux des points a/,b’,c', disons b’ et c’, sont sur les côtés du triangle (figure 1), 
soit aucun point a’,b’,c' n’y est (figure 2). Supposons par exemple que les points 
soient comme sur la figure 1 (le raisonnement est analogue sinon). 


ù \ pe. | 


Te 


+ a. 
AU Figure 1 IF ee & 


Figure 2 


On interprète alors les rapports de la relation comme des rapports d’aires (au signe 
près) en faisant apparaître deux fois l’aire de a’bc’ : 

A(a'bc') : A(b'cc') : A(c'aa') 

A(a'cc')  A(b'ac)  A(c'ba!) 


et on conclut en appliquant les lemmes des proportions et du chevron. 
Remarque. En fait, on peut s’épargner la distinction des cas de figures en utilisant 
l’invariant “aire algébrique”, c’est-à-dire, cf. 83, le déterminant des vecteurs ou le 
produit vectoriel, mais cela suppose de travailler à un niveau plus avancé. 
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e) Application 4 : Céva et Gergonne. 
Les idées évoquées ci-dessus permettent aussi de montrer sans difficulté les 
théorèmes de Céva et de Gergonne : 


Soit abc un triangle et a’,b',c! des points de (bc), (ca), (ab) respectivement. Alors, 
si les droites (aa/), (bb'), (ec') concourent en o on a les relations : 


a'b  b'e c'a og ob! oc! 
x x = —1 (Céva et + + — 1 (Gergonne). 
ac bla  c'b ( aa bb! cc! ( L 


Là encore, il y plusieurs cas de figure à considérer si on travaille avec les aires, 
qui sont unifiés si on utilise le produit vectoriel. Supposons par exemple que les 
points a/,b',c' sont sur les côtés du triangle. Pour Gergonne on note alors qu’on 

og A(obc) 
aa — A(abc) 


fois le lemme du chevron. 


et les relations analogues avec b’ et c’. Pour Céva on utilise trois 


f) D'autres exemples encore. 


On peut utiliser encore les quatre lemmes à bien d’autres fins et notamment 
en géométrie euclidienne puisque l’aire est a fortiori un invariant du groupe des 
isométries. On peut ainsi montrer Pythagore (comme le faisait Euclide) ou encore 
un certain nombre de relations métriques dans le triangle, en voici un exemple 
entre mille (avec les notations usuelles) : 


a b c 


sinA snB sin C 


Le lecteur intéressé pourra consulter à ce sujet la brochure [IP] de l'IREM de 
Poitiers qui comporte un grand nombre d'exemples intéressants. 


Voici encore un petit problème dont la solution est évidente en termes d’aires (ou 
en utilisant les cas d’isométrie des triangles), mais moins facile si l’on n’emploie 
que les transformations : 


Les hauteurs bb! et cc’ d’un triangle abc sont égales. Montrer que abc est isocèle. 


Signalons enfin un thème classique, mais très riche, qui peut faire l’objet de 
multiples situations de recherche dans des classes et où les quatre lemmes seront 
très efficaces. Il s’agit du partage de polygones en parties de même aire ou ayant 
des rapports d’aires donnés, cf. [F]. En voici un exemple simple : 


On considère un triangle T et un point m situé sur un côté de T. Comment partager 
T'en deux parties de même aire par une droite issue de m ? 


On peut ensuite demander de partager le triangle en trois, ou passer au cas d’un 
quadrilatère, etc. 


g) Un mot sur le découpage. 


Nous avons dit plus haut que les lemmes “du collège” peuvent tous être prouvés 
en utilisant la formule base X hauteur / 2. 

Il y a toutefois de bonnes raisons didactiques, s’agissant de l’introduction des aires 
à l’école élémentaire et au collège, de ne pas écraser trop vite la notion d’aire sur 


les nombres, cf. [DPG]. Cela peut conduire à préférer les procédures de découpage 
et recollement à un usage trop exclusif des formules. 

De plus, nous allons voir que cette procédure de découpage est très efficace 
puisqu'elle permet de montrer tous les lemmes évoqués ci-dessus à partir du seul 
lemme du demi-parallélogramme (ï.e. l’invariance par symétrie centrale). 

À posteriori, ce phénomène a une justification théorique intéressante qui vient du 
théorème de Bolyai, revu par Hadwiger-Glur (cf. annexe 2 ou [B1] et [B2]). En effet, 
ce théorème affirme que deux polygones de même aire sont toujours équivalents par 
découpage et recollement (c’est-à-dire par puzzle) et qu’il suffit même d'utiliser, 
pour déplacer les pièces, des translations et des symétries centrales. Comme toute 
translation est elle-même composée de deux symétries centrales on peut même 
utiliser seulement les symétries. Si P et Q sont deux polygones de même aire, on 
peut donc passer du polygone P au polygone Q en découpant P en un nombre 
fini de polygones P;, puis en déplaçant les P; par des symétries centrales et en les 
utilisant pour reconstituer Q. 


Si l’on croit en ce résultat, on doit pouvoir montrer le lemme du trapèze et celui 
de la médiane par découpage à partir du lemme du demi-parallélogramme. C’est 
effectivement le cas (et c’est à peu de choses près ainsi que procède Euclide !). 
On montre en effet, successivement (le lecteur se reportera aux figures qui parlent 
souvent d’elles-mêmes) : 


e qu'un triangle (ici mcd, cf. figure 3) dont la base est l’un des côtés d’un 
parallélogramme et dont le sommet est sur le côté opposé a pour aire la moitié de 
celle du parallélogramme : on trace la parallèle à (ad) par m qui recoupe (cd) en 
n et on applique deux fois le lemme du demi-parallélogramme, 

e le lemme du trapèze, cf. figure 4 (il y a un autre cas de figure plus facile) : on a 
A(abc) = À A(aa/b'b) — A(a'cb') par la remarque précédente et cette aire est encore 
égale à A(a'bc) par le lemme du demi-parallélogramme, 


m b à à 
Figure 3 Figure 4 Figure 5 


e le lemme de la médiane, cf. figure 5 : les deux parallélogrammes aba’d et aa’cd 
ont même aire (ils ont une moitié commune : ada/), donc leurs moitiés aba' et aca’ 
ont aussi même aire. 

Il reste à montrer le lemme des proportions. Là on n’évite pas un problème 


passage à la limite. On commence par montrer le lemme lorsque le rapport r = —— 
a!c 

1 
vaut 5m Par application répétée du lemme de la médiane. On en déduit que le 


k 
lemme des proportions vaut lorsque r est de la forme gn Par additivité de l’aire. 


Pour conclure il reste à utiliser la croissance de l'aire (qui résulte de l’additivité) 
pour obtenir un encadrement et passer à la limite. Bien entendu ce phénomène 
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est inévitable et il est implicitement présent déjà dans un calcul aussi familier que 
celui de l’aire du rectangle comme produit de la longueur par la largeur et donc 
aussi dans le calcul de l’aire du triangle. 


Entendons-nous bien : même si nous considérons que les méthodes de découpage- 
recollement sont satisfaisantes car elles permettent d'obtenir tous les résultats visés 
avec une remarquable économie de moyens, nous ne disons pas qu'il est nécessaire 
de faire toutes ces démonstrations au collège. En effet, la formule base X hauteur 
/2 a le mérite de permettre des conclusions rapides et convaincantes. En revanche, 
s’il s’agit de construire la notion d’aire et d'apprendre à raisonner, initier les élèves 
à utiliser ce type de preuves dynamiques nous semble un objectif intéressant. 


3. Explication du succès de la méthode : la théorie des invariants. 


Il s’agit de la théorie des invariants polynomiaux associés à un groupe. Cette 
théorie a été fondée vers le milieu du dix-neuvième siècle par Cayley, Sylvester et 
Hermite. Dans ce paragraphe nous allons en expliquer le principe dans le cas de la 
géométrie affine plane afin de montrer que l'efficacité de l’invariant aire constatée 
au paragraphe précédent, n’est pas due au hasard, mais qu’elle est totalement 
justifiée par la théorie. 

Le lecteur est averti que le paragraphe qui suit, et qui est de nature algébrique, 
va être un peu plus technique (encore que les démonstrations délicates soient 
rejetées dans l’annexe 1). Cependant, ces considérations sont indispensables pour 
comprendre les raisons profondes de l’importance de l’aire en géométrie affine. 


Dans ce paragraphe nous travaillerons dans un plan affine réel, associé à un 
espace vectoriel de dimension 2 et muni d’un repère affine : un point o et deux 
vecteurs indépendants e:,e2. On peut alors identifier un point x du plan avec le 
vecteur où ou encore avec le couple de ses coordonnées : x = (x1,x%2). Nous ferons 
systématiquement ces identifications dans ce qui suit. 


a) Action sur les polynômes. 


Lorsqu'on travaille en géométrie affine plane on considère au départ des points 
donnés du plan. Prenons l’exemple le plus simple : celui de la géométrie d’un 
triangle à, b, c. Ces points sont décrits par leurs coordonnées dans le repère 0, e1, €: : 
a — (a1,a2), b = (b1,b2), € — (c1,c2) et la plupart des constructions “affines” 
usuelles de points du plan à partir des données (notamment par intersections de 
droites, voir ci-dessous) conduisent à des points dont les coordonnées sont des 
fonctions polynomiales ou rationnelles en les à;, b;, ci. (°) 


Le groupe affine du plan (engendré par les translations et les applications linéaires 
bijectives du plan dans lui-même) agit alors sur les points donnés. Quitte à faire 


On supposera en général les points à, b,c “généraux”. Cela signifie qu’ils ne sont pas 
liés par des relations algébriques, par exemple qu'ils ne sont pas alignés. En vertu 
du théorème de prolongement des identités algébriques on peut alors identifier 
fonctions polynomiales et polynômes en a, b, cet donc considérer les a;, b;,c; comme 
des indéterminées. 
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une translation, on se ramène au cas où l’origine est fixe, (©) de sorte que le groupe 
qui agit est alors GL(2) = GL(2,R), groupe des applications linéaires inversibles 
(ou des matrices 2 x 2 inversibles) avec lequel nous travaillerons désormais. Ce 
groupe agit simplement sur les coordonnées des points à,b,c par l’intermédiaire 
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; dou ; a 
des matrices, ainsi, si u à pour matrice É sa 


u(a1,a2) = (aa + Paz,” yai + Üa2). 


On en déduit une action de GL(2) sur l’anneau de polynômes R{a:, a2] (et sur le 
corps des fractions rationnelles, ou plus généralement sur les fonctions de a et &2) 
définie au moyen des formules ci-dessus. Précisément, si P est un polynôme et u 
un élément de GL(2), u agit sur P (7) par : 


(P.u)(a) = (Pou)(a) = P(u(a)), c’est-à-dire (P.u)(a1,a2) = P(u(a,a2)), 


ou encore, si u admet la matrice ci-dessus, (P.u)(a1,a2) = P(aa; +/Ba2,7ya1 +0a2). 
Bien entendu GL(2) opère aussi sur R/a:, a2,b1,b2,c1,c2] en posant 


(P.u)(a, b,c) = (P.u)(a1,a2,b1,b2,c1,c2) = P(u(a, a2), u(b1,b2), u(cr, c2)) 


et on a évidemment une définition analogue avec un nombre quelconque de points. 


Donnons quelques exemples concrets de cette opération en prenant pour P le 
polynôme af + a? qui, dans le cas euclidien, correspond au carré de la norme 


— 1 
du vecteur a. Si u est l’affinité de matrice È +) on à P.u = af + ai ; si 


) (qu’on appelle une transvection), on a 


cos Ô a. 


sin  cosô 


v est l’application de matrice é 1 


Pv = a? +2)aja2 + (X?+1)a2 ; si w est l’application de matrice ( 
(une rotation) un petit calcul donne P.w = P. 
b) Invariants. 


On désigne simplement par le mot invariants les polynômes (ou les fractions 
rationnelles, voire les fonctions) invariants par cette action (ou par celle d’un sous- 
groupe). On voit, par exemple, que le polynôme a? + aÿ est invariant par rotation, 
mais ni par affinité, ni par transvection. 


En fait, les notions auxquelles nous nous intéressons étant toutes de nature 
vectorielle (elles dépendent des vecteurs et non des points, penser à la longueur, 
l’angle ou l’aire), elles sont automatiquement conservées par les translations qui 
ne jouent donc aucun rôle dans la théorie. 

Telle que nous venons de la définir, il s’agit d’une opération à droite. Si l’on souhaite 
avoir une opération à gauche, ce qui est plus habituel, il faut poser 


(u.P)(a1,a2;b1,b2; C1, C2) = P(u- (ar, a2);u"(b1,b2);u (ci, c)). 


Nous avons choisi ici l'opération à droite pour éviter d’avoir trop d’exposants —1. 
On notera que cela ne change pas les invariants. 
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On trouve, parmi les invariants du groupe SL(2) des applications linéaires de 
déterminant 1, les déterminants a À b = a1b2 — a2b1 et de même bAcet cAa. En 
a 

ô 


ee <) on vérifie qu’on a a Ab = dét À et (a Ab).u = dét (UA) = dét À = aAb 


effet, si u a pour matrice U = ( ): de déterminant 1 et si À est la matrice 


a2 bo 
(on peut aussi faire la vérification à la main). Sous l’action du groupe GL(2) tout 
1 b 
. En 
C 
effet, si on applique une transformation uw de déterminant À, le numérateur et le 
dénominateur sont multipliés par À, de sorte que la fraction est invariante. 


: : : ; a 
entier on trouve notamment comme invariants les quotients du type 


Ces invariants ont, bien entendu, un sens géométrique. De fait, la quantité S (GA b) 
n’est autre que l’aire algébrique du triangle oab, comptée positivement si la base 
(a, b) est directe, négativement sinon. Il n’est pas difficile de se convaincre de ce 
fait en utilisant le découpage et recollement. On peut aussi le comprendre, dans le 
cadre euclidien, en interprétant le déterminant a À b comme produit vectoriel des 
vecteurs a et b. 


c) Retour aux lemmes du collège. 


Nous venons de montrer algébriquement que l’aire est un semi-invariant dans 

l’action du groupe affine. En réalité, c’est ce que nous avions établi géométriquement 

au paragraphe précédent avec les quatre lemmes du collège. ($) 

En effet, prenons dans le plan le repère affine à, b, c (avec a comme origine). Parmi 

les transformations de GL(2) il y a en particulier les suivantes : 

Il y a d’abord les transvections (certains auteurs parlent de cisaillements, traduc- 

tion de l’anglais shear), qui correspondent, à changement de base près, aux matrices 
LC 
0 1 

une parallèle à (ab). 

La traduction de l’invariance de l’aire par transvection n’est autre que le lemme 

du trapèze. 


. Géométriquement, une telle transformation fixe a et b et déplace c sur 


0 ‘ . Géométriquement, 
une telle transformation fixe encore a et b, mais déplace c sur la droite (ac). La 
traduction de la semi-invariance de l'aire par dilatation n’est autre que le lemme 
des proportions. 

Un cas particulier de dilatation est la symétrie oblique d’axe (ab) et de direction 
(ac) qui correspond à À = —1. La traduction de l’invariance de l’aire par symétrie 
oblique n’est autre que le lemme de la médiane. 

Enfin, pour faire bonne mesure, on peut aussi ajouter à ces éléments la symétrie 
centrale, de matrice —Id, pour laquelle la traduction de l’invariance est le lemme 
du demi-parallélogramme. 

Comme le groupe GL(2) est engendré par les dilatations et les transvections (voir 
par exemple [P] Chapitre 4, ou faire un petit calcul à la main) on voit que les 


: ; : ne . Ï 
Il y a ensuite les dilatations (ou affinités), de matrices ( 


En fait, ce que nous avons prouvé c’est l’invariance de l’aire ordinaire, valeur 
absolue de l’aire orientée, et c’est ce qui nous à amené à distinguer des cas de 
figures pour exprimer les aires tantôt comme sommes, tantôt comme différences. 


LsZ 
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lemmes du collège montrent en fait toute la semi-invariance. (°) 
d) La théorie : premier point. 


Le premier point fondamental de la théorie des invariants, dans le cas du groupe 
linéaire comme d’ailleurs de tous les groupes dits “classiques” qui gouvernent les 
géométries usuelles, c’est qu’on sait déterminer explicitement tous les invariants. 
Dans le cas ci-dessus, on démontre (mais ce n’est pas un résultat tout à fait 
trivial, cf. annexe 1 ou [W]) que les invariants du groupe SL(2,R) s'expriment 
polynomialement à partir des trois produits a À b, bAc et c A a. Pour le groupe 
GL(2,R)) il n’y à pas d’invariants polynomiaux non constants, mais les fractions 
rationnelles invariantes sont des quotients de deux polynômes homogènes de même 
degré invariants sous SL(2). 


Ce résultat est la confirmation de ce que nous avions avancé au paragraphe 1 : 
l’invariant aire (ou rapport d’aire) est bien, dans le cas de la géométrie affine d’un 
triangle, le seul possible. (1°) 

Comme les quatre lemmes du collège montrent cette invariance, ils épuisent donc 
la théorie sur ce point. 


e) Relations et théorèmes. 


Nous en venons au second point de la théorie : le lien entre les invariants et les 
théorèmes. Reprenons le cas de la géométrie affine, avec une origine o et trois 
points a, bet c. 


Idée 1 : points et invariants. 


Nous avons d’abord besoin de préciser un peu formellement ce qu’on peut appeler 
une construction affine. 


D'abord, effectuer une construction c’est produire, à partir des points de départ 
a, b,c un nouveau point m. Autrement dit, une construction est une application 
F qui associe aux points de départ à, b, c un certain point m = F(a,b,c). Ensuite, 
dire qu’on a affaire à une construction affine signifie que cette application est 
résistante aux changements de repères affines, c’est-à-dire aux bijections affines. 
Si g est une application affine bijective du plan (ou même linéaire si on continue 
à fixer l’origine o conformément à nos principes), la construction F doit donner la 


On peut même oublier les transvections car elles sont produit de deux symétries : 


LA PL “0 1 2 
(oi) 6 5) 3) 

Le lecteur avisé pourra donc, à titre d'exercice, montrer qu’on retrouve le lemme 
du trapèze à partir de celui de la médiane. 

Le résultat est d’ailleurs valable pour un nombre quelconque de points. Dans la 
théorie on considère aussi, à côté des vecteurs, des directions de droites, c’est-à- 
dire des formes linéaires sur le plan vectoriel. On a alors de nouveaux invariants de 
deux types : soit f(a), si f est une forme et a un vecteur, soit le déterminant f Ag, 
si f et g sont deux formes. Pour certains exemples géométriques, par exemple celui 
de Ménélaüs, les démonstrations sont plus commodes en utilisant à la fois vecteurs 
et formes, mais cela déborde du cadre de notre propos. 


(ri 
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même chose après transport par g. En termes mathématiques cela signifie qu’on 
peut parcourir le diagramme suivant dans n’importe quel sens : 


a, b,c Es F(a,b, c) 
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g(a),g@),g(e) = F(g(a),g(b),g(c)) = g(F(a,b,c)), 
c’est-à-dire que F et g commutent : F{g(a), g(b), g(c)) = g(F(a,b,c)). 
Le lecteur vérifiera que c’est le cas pour toutes les constructions usuelles de la 
géométrie affine, (11). Par exemple, si F consiste à prendre le milieu m de [a, b], et 
si on transforme à, b par g, g(m) sera bien le milieu de [g(a), g(b)]. 
Par ailleurs, comme les points b et c sont généraux, l’origine o et les points b, c 
ne sont pas alignés, donc forment un repère affine du plan. On peut donc écrire, 
dans ce repère associé au triangle F(a,b,c) = fi(a,b,c)b + f2(a,b,c) c avec 
fi(a,b,c) € R. On a alors le résultat suivant, évident mais fondamental (et qui 
vaut dans un cadre beaucoup plus général) : 


La construction m = F(a,b,c) est affine si et seulement si les fonctions f1 et f2 
sont invariantes sous l’action de GL(2,R). 


Démonstration. Soit g € GL(2,R). Comme g est linéaire, on a g(m) — 
f1(a, b, c) g(b) + f2(a, b, c) g(c). Or, l'hypothèse que la construction est affine donne 
la relation : 


g(m) = fi(g(a), gb), g(c)) g(b) + fa(g(a), g(b), g(c)) g(c), 
mais, comme g(b),g(c) est une base du plan vectoriel, on en déduit f1(a,b,c) = 
g( 


fi(g(a), g(b), g(c)) et fa(a,b,c) = fa(g(a), g(b), g(c)), cafd. 


Autrement dit, les coordonnées dans le repère 0, b, c des points construits, par des 
constructions affines, à partir des points a, b, c sont des polynômes ou des fractions 
rationnelles en les indéterminées à;, b;, c; (et en tous cas des fonctions des à;, b;, c;) 
qui sont des invariants. Donnons quelques exemples, le lecteur pourra en produire 
de nombreux autres. Le point a lui-même s’écrit dans ce repère 


Lie \a F a Ab : 
 cAb END ? 
(il suffit d'écrire a — Àb+uc et d'appliquer . Ab et .A\c pour calculer À et u) tandis 


que le point b’, intersection de (ob) et (ac) s'écrit 


; —c\a 


| aAb+bAc 
et le point c”, intersection de (ab) et de la parallèle à (bc) passant par bd’ s’écrit : 
nr a\b+añc a Ab 


_añb+bAc aAb+bAc 


Idée 2 : théorèmes et relations. 


On entend notamment par là les opérations suivantes : construction de la droite 
passant par deux points, intersection de deux droites, construction de parallèles, 
de milieux et de barycentres, etc. 
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On montre facilement que toutes les propriétés usuelles de géométrie affine 
(alignement de points, concourance de droites, rapports de mesures algébriques) 
s'expriment comme des relations, polynomiales elles aussi, entre les coordonnées 
des points en question dans un repère quelconque (ou entre les coefficients des 
équations des droites). Par exemple, dire que les points æ = (x1,x%2), y = (y1,y2), 
z = (21,22) sont alignés c’est dire que le déterminant D; ci-dessous est nul, tandis 
que dire que les trois droites u;x + v;y + w; = 0, (i — 1,2,3) sont concourantes 
c’est dire que le déterminant D est nul : 


1 1 1 Uj OU] W] 
D =|xt1 y |, Do = |'u2 V2 w2 
T2 Y2 22 Uu3 V3  U3 


Dans les deux cas on a bien des relations polynomiales entre les coordonnées ou 
les coefficients. 

Comme on a vu que les coordonnées des points (dans le repère 0,b,c) sont des 
invariants on peut donc formuler le principe suivant : 


Principe : Les théorèmes de la géométrie affine du triangle s’obtiennent comme 
relations polynomiales entre les invariants du groupe GL(2,R). 


Exemple : les médianes. 


Pour illustrer ce principe, voici la démonstration en termes de relations entre 
invariants, de la concourance des médianes du triangle. 


On considère un triangle a, b,c. Dire que l’origine o du plan est sur la médiane 
issue de a signifie qu’on a a A (b+c) = 0. (1?) Or, on a la relation (triviale) entre 
les invariants 

a A(b+c)+bA(c+a)+cA(a+b) =0 


qui traduit la bilinéarité et l’antisymétrie du déterminant, de sorte que si on prend 
pour origine l’intersection de deux des médianes, elle est aussi sur la troisième. 


f) La théorie : deuxième point. 


L'intérêt d’avoir identifié les théorèmes d’une géométrie et les relations entre les 
invariants de cette géométrie vient alors du second résultat fondamental de la 
théorie des invariants. En effet, ce résultat affirme que, dans toutes les géométries 
usuelles, non seulement les invariants sont connus, mais encore les relations 
éventuelles entre eux le sont aussi. Dans le cas de la géométrie affine de trois 
points, on démontre (ce n’est pas très difficile, cf. annexe 1) qu’il n’y a pas de 
relations non triviales entre les trois invariants a À b,b À c,c A a. En revanche, à 
partir de 4 points à, b, c, d, si on a toujours les mêmes invariants, il apparaît des 
relations non triviales du type : 


(bAc)(a A d)+(cAa)(bAd)+(a/Ab)(cAd) = 0. 


Si on préfère écrire avec des vecteurs munis de flèches, cette égalité devient 
où (ob + è) = 0. Si on pose Om = ob + 5è, la relation signifie que o,a,m 
sont alignés. Or, obmc est un parallélogramme, de sorte que (om) passe par le 
milieu a’ de [bc] et on a bien le résultat. Cette relation n’est autre que la version 
algébrique de l'égalité d’aires A(oab) — A(oac) utilisée au paragraphe 2. 
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En effet, cette relation s'obtient à partir de la formule (bAc)a+(cAa)b+(ab)c = 0 
que nous avons vue ci-dessus en appliquant . À d. À notre connaissance, cette 
relation n’a pas de traduction très spectaculaire dans le cadre de la géométrie 
affine du plan réel. En revanche, elle se traduit en termes de birapports par la 
relation bien connue [abcd] + [acbd] = 1. Si on travaille sur les complexes, on en 
déduit en particulier le théorème de Ptolémée : si un quadrilatère convexe abcd est 
inscrit dans un cercle le produit de ses diagonales est égal à la somme des produits 
de ses côtés opposés. 


g) Bilan. 


Ainsi, ce qu'affirment le programme d’Erlangen et la théorie des invariants, c’est 
qu'on peut, en principe, obtenir tous les théorèmes de géométrie à partir de la 
connaissance des invariants et de leurs relations éventuelles. Or, dans le cas de 
la géométrie affine du triangle, nous avons vu qu’il n’y à qu’un invariant : l’aire 
et aucune relation. C’est ce qui explique que les quatre lemmes du collège qui 
expriment que l’aire est un (semi)-invariant sous le groupe affine permettent de 
prouver tous les théorèmes du domaine considéré. 


4. Conclusion. 


L’unique conclusion que nous souhaitons retenir de cette étude sur le programme 
d’'Erlangen et les invariants c’est l’importance capitale de ceux-ci. Il est assez 
clair que la plupart des promoteurs de la réforme des mathématiques modernes 
avaient en tête le programme d’Erlangen, mais pas le codicille que constitue la 
théorie des invariants, ce qui les a conduit à occulter ceux-ci au profit des seules 
transformations et cet état de fait perdure encore, sous une forme atténuée certes, 
de nos jours. C’est un point sur lequel le rapport de la commission Kahane insiste : 
il y à un grand intérêt, notamment pour l’enseignement de la géométrie au collège, 
à utiliser les invariants et pas seulement les transformations. Nous espèrons que 
les quelques exemples développés ici le montrent suffisamment. De plus en plus 
de professeurs en sont convaincus par leur pratique, mais, formés à l’usage quasi- 
exclusif des transformations, ils ne se sentent pas encore autorisés à prendre un peu 
de recul par rapport à celles-ci et sont souvent réticents envers des preuves utilisant 
les aires comme celles vues ci-dessus, ou les angles en géométrie euclidienne. 
On constate d’ailleurs le même phénomène par rapport aux cas d’“égalité” des 
triangles. Nous voudrions ici les rassurer en leur apportant une sorte de caution 
théorique. 


Un autre point est apparu clairement dans ce qui précède : c’est l’importance de 
la figure. En effet, les démonstrations géométriques utilisant les aires nécessitent 
souvent de distinguer plusieurs cas de figure. C’est la rançon du fait de n’utiliser 
que la valeur absolue de l’invariant aire algébrique, c’est-à-dire du déterminant 
ou du produit vectoriel. En contrepartie, l'avantage de l’utilisation des aires c’est 
son côté visuel, qui manque cruellement quand on manipule produits vectoriels 
et relations de Chasles de manière purement algébrique. On a alors le sentiment 
d’une activité purement mécanique, comme le notait déjà Jean-Jacques Rousseau : 
Je n'ai jamais été assez loin pour bien sentir l’application de l'algèbre à la 
géométrie. Je n’aimais pas cette manière d’opérer sans voir ce qu’on fait, et il me 
semblait que résoudre un problème de géométrie par les équations, c'était jouer un 
air en tournant une manivelle. 
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Nous considérons pour notre part ce passage par les figures, avec les difficultés 
inhérentes aux divers cas à envisager, comme une étape inévitable et nécessaire au 
collège. L’unification qu’apportent les calculs vectoriels, pour intéressante qu’elle 
soit, doit venir à son heure, c’est-à-dire, sans doute, au lycée. Ensuite, par rapport 
aux difficultés liées notamment à la convexité, qui est souvent sous-jacente dans 
ce type de problèmes, notre opinion est que les professeurs doivent maîtriser ces 
questions, mais qu’il est inutile, voire néfaste, de soulever trop tôt ces difficultés 
pour les jeunes élèves. L'objectif de la géométrie au collège n’est certes pas de 
s’échiner à montrer, avec peine, des choses que l’on voit aussitôt sur la figure, mais 
plutôt d'utiliser des outils intuitifs et efficaces comme les notions de longueur, 
d'angle et d’aire et un premier apprentissage du raisonnement, pour établir des 
théorèmes non évidents. 


Pour terminer nous voudrions ajouter un point important. Nous espérons évidem- 
ment avoir convaincu le lecteur de l’intérêt et du bien fondé de l’utilisation de 
la notion d’aire au collège comme outil de démonstration. Toutefois nous serions 
désolés s’il en déduisait qu’hors des aires il n’est point de salut et courait jeter 
aux orties toutes les autres démonstrations de Thalès et des autres. Plus que toute 
méthode, si pertinente soit-elle, la variété des approches ne fait-elle pas tout le 
charme de notre discipline ? 
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de son intérêt. Le lecteur doit à l’acuité de sa vision géométrique une bonne partie des lemmes 
ci-dessus et de leurs démonstrations. Pour tout cela et pour bien d’autres choses encore, je la 


remercie chaleureusement. 


Annexe 1 : Les invariants du groupe GL(2) 


0. Introduction. 


Dans cette annexe on détermine les invariants des groupes GL(2,R) et SL(2,R) 
dans leur action sur les polynômes en six variables a1, @2; b1,b2; C1, c2 correspondant 
à trois vecteurs a,b,c de R?. Ce cadre est essentiellement celui de la géométrie 
affine du triangle évoquée dans le corps du texte. Le lecteur qui désirerait en 
savoir plus sur le cas général pourra consulter [W] (mais cet ouvrage, déjà ancien, 
n’est pas d’une lecture facile). 


1. Les opérations et les invariants. 


a) Opérations. 


L’anneau de polynômes À = Rl{a:, a2;b1,b2;c1,c2] sera noté aussi R{a, b, c] en 
posant a — (ai,a2), b — (b1,b2) et c = (c1,c2). On considère le groupe linéaire 
GL(2,R) = GL(2) des matrices 2 x 2 à coefficients réels. On rappelle que si u est 
ô 
ô 
Le groupe GL(2) admet une opération naturelle sur l’anneau A obtenue en posant, 
pour u€ GL(2,R)et PE A: 


(P.u)(a1, 2; b1, ba; C1, C2) = P(u(ar, a2); u(b1,b2); u(cr, c2)). 


la matrice , on a la formule u(x1,x2) = (ax1 + Br2,yx1 + Ôx2). 


On peut aussi considérer cette opération en restriction à un sous-groupe G de 
GL(2), notamment au sous-groupe SL(2) des matrices de déterminant 1. 


Les opérations ci-dessus s'étendent immédiatement au corps des fractions ra- 
| F Pi 
tionnelles R{(a, b, c) en posant —.u = —. 
Q Q.u 
b) Invariants. 
Définition 1.1. 
Soit G un sous-groupe de GL(2) (par exemple G = GL(2) ou G = SL(2)). 
1) On appelle invariant sous G un polynôme (ou une fraction rationnelle) P qui 
vérifie P.u = P pour tout u € G. 
2) On appelle invariant relatif sous G un polynôme (ou une fraction rationnelle) 
P qui vérifie : pour tout u € G il existe A(u) € R* tel que P.u = X(u)P. 
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Remarques 1.2. 

a) Il est clair que l’ensemble des invariants est une sous-algèbre de R{a, b, c|. 

b) Le cas des invariants relatifs sera étudié au 84. On verra que le multiplicateur 
X(u) est lié au déterminant de u. 


Proposition 1.3. 
Les polynômes b À € = b1c2 — bac, CA à = Cia2 — coa et a Ab = a1b3 — a2b1 sont 
des invariants sous SL(2) et des invariants relatifs sous GL(2). 


bo C2 
on à m(u(b),u(c)) = u m(b,c). Comme b A c n’est autre que détm(b,c) on en 
déduit (b A c).u = (dét u)(b A c), ce qui prouve l’assertion. 


Démonstration. Soit m(b,c) la matrice 6 . L Si u est une matrice de GL(2) 


c) Quelques propriétés des invariants. 


Désignons par x = (x1,%2) l’un des couples d’indéterminées a, b,c. Un polynôme 

P(a,b,c) sera dit homogène de degré d en x s’il est de la forme Ÿ, On TT 
in +i2=d 

où les @;, ;, sont des polynômes en les variables autres que les x;. On a alors le 

résultat suivant: 


Proposition 1.4. 

Soit P € R{a, b, c| un polynôme. 

1) Le polynôme P s'écrit de manière unique sous la forme P — De Fe Où 
i,5,k 

somme est étendue aux indices 0 <i <p,0<3<qg0<k<7r et où P;;r est 

homogène de degré i en a1,a2, j en b:,b2 et k en c1,c. 

2) Le polynôme P est invariant sous SL(2) ou GL(2) si et seulement si tous les 

P;,j,8 le sont. 


Démonstration. Pour l'existence de l'écriture il suffit de regrouper dans P tous les 
monômes des degrés considérés. 

L’assertion sur les invariants résulte du fait que l’opération conserve les degrés 
partiels en à, b, c. 


2. Polarisation. 


a) Définition. 


Il s’agit d’une opération sur les polynômes, liée à la dérivation, qui va jouer un 
rôle crucial dans le calcul des invariants. Cette notion a un sens général, mais 
nous contentons de la définir dans le cadre restrictif dans lequel nous nous sommes 
placés. 


Définition 2.1. 

Soit f € R{a,b,c]. On désigne par x,y deux des lettres a,b,c (éventuellement 
égales), de sorte que x et y sont des couples (x1,22), (y1, y2). On définit le polynôme 
Dyxf € R{a, b, c] par la formule : 


Ô 0 
Dfte; b, c) = no (a b, c) + PAC b, Ge 
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Remarques 2.2. 
a) Les applications D, sont des endomorphismes de l’espace vectoriel R{a, b, c| 
appelés polarisations. 
b) Si f ne dépend pas de x on à D,,f = 0. Si f est un polynôme homogène de 
degré p en les variables x et q en les variables y l'opération D, transforme f en 
un polynôme homogène de degré p — 1 en x et q +1 en y. 
c) Si f est un polynôme homogène de degré p en x, on a D;,4f = pf. 
d) Soit f € R{a. b, c|. Considérons f comme un polynôme en +. Le polynôme D,,,f 
est le coefficient du premier degré dans le développement de Taylor de f(x + ty), 
pourtER : 

+ ty) = f(x) + ÉDyxf(e y) +8 
b) Polarisation et invariants. 


L'intérêt de l’opération de polarisation est qu’elle transforme invariants en invari- 
ants. Dans ce qui suit G désigne un sous-groupe de GL(2). 


Proposition 2.3. 
Soit f € R{a, b, c] un invariant sous G. Alors D,,,(f) est invariant sous G. 


Démonstration. Soit u € G. En vertu de l’invariance de f on a, pourtE R : 
f(u(a+tb),u(b),u(c)) = f(a+tb,b,c), 


soit encore, puisque u est linéaire, f(u(a) + tu(b),u(b),u(c)) = f(a +tb,b,c). On 
développe ces deux termes par la formule de Taylor et on obtient, au premier 
ordre : 


f(u(a), u(b), u(c)) + Dj (ua), u(b), u(c)) f(a, b, c) Æ tDwf(a, b, G: 
Comme f est invariant, on voit que D f l’est aussi. 
Précisons ce que deviennent les invariants de la proposition 1.3 : 


Proposition 2.4. 
Les polynômes b À c, c A a, a Ab sont permutés (au signe près) ou transformés en 
0 par polarisation. Précisément, on a les formules : D(a À b) = Dra(a A b) = 0, 
Daa(a À db) = a Ab, Dia(a À db) = c A b, etc. 
c) L'identité de Capelli. 
Voici l’outil principal de ce paragraphe : 
Théorème 2.5. 
Soit f € R{a, b, c] un polynôme. On à l'identité : 
Dyy © Dex(f) + Dra(f) — Dry © Dya(F) = (x AY) y (F) 
__ ©f of 
_ Or10y Oyôr2 


Démonstration. Comme les opérations de polarisation sont linéaires, il suffit de 


montrer la formule pour les monômes de la forme f = are yp 1yp2, C’est un 


calcul sans malice, on a : 
Doy © Dyaf = [o1(B +1) + a2(B2 + 1)] f + a1B2xt Ed nn se : 


œi1+1,,a2—1,/81—1, B2+1 
+ a217 Lo UV: EE 


où l’on a posé Q;y(f) 
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puis Dyyf = (B1 + B2) f et Dis f = (ai + 2) f, d’où 


Dyy © Daa(f) + Dea(f) = (81 + B2 + 1)(o1 + @2) f. 


Enfin on à Q,yf — CAT HE OT EE CE — air ta tif 


résultat en multipliant par x A y. 


, d’où le 


3. Calcul des invariants sous SL(2). 


a) Détermination des invariants. 
Le théorème essentiel de ce paragraphe est le suivant : 


Théorème 3.1. 
Soit f un polynôme de R{a, b, c| invariant sous SL(2). Alors f est un polynôme en 
bAc,;c/A\a,a/A\b. 


Démonstration. Dans ce qui suit on désigne par À le sous-anneau de R{a, b, c| 
engendré par bAc, cAaet a / b. En vertu de 1.4 on peut supposer que f est 
homogène (séparément) en à, b, c. On ordonne ces polynômes de la façon suivante : 
si le degré total de f est plus petit que celui de g on dit qu’on a f < g. Si ces 
polynômes ont même degré total on ordonne suivant l’ordre lexicographique des 
degrés en a,b,c (le degré en a prédomine). On raisonne alors par l’absurde en 
supposant qu'il y ait un polynôme invariant trihomogène f qui n’est pas dans À 
et on choisit un tel polynôme minimal pour l’ordre ci-dessus. Ce polynôme n’est 
pas une constante (sinon il serait dans À). Supposons qu'il soit de degré p > 0 en 
a et q en b (la démonstration est la même, mutatis mutandis dans les autres cas). 
On applique l’identité de Capelli à f avec x = a et y = b. On a donc 


D O De(}) % DEP) Ti D © DC) = (a A b)Oub(f). 


Comme f est invariant il en est de même des polarisations de f (cf. 2.3). Il en 
résulte que (a À b)Q,,(f) est invariant et, comme a A b l’est aussi, Q,,(f) est un 
invariant. Comme Q,4(f) est de degré total strictement plus petit que celui de f, 
l'hypothèse de minimalité montre que Q4(f) est dans À. D'autre part, Di, f est 
un polynôme invariant de même degré total que f mais de degré plus petit en a 
(cf. 2.2.b). Vu l'hypothèse de minimalité du choix de f, il est donc dans À. Mais 
alors, la stabilité de RÀ par polarisation montre que D,4 o Di,(f) est aussi dans À. 
On en déduit que D o Dua(f) + Daa(f) est dans À, mais ce polynôme n’est autre 
que (q+1)pf, et comme (q + 1)p est non nul, f est dans À, ce qui est absurde. 


b) Détermination des relations. 
Comme on l’a annoncé, il n’y en a aucune : 


Théorème 3.2. 

Le sous-anneau R de R{a, b, c| engendré par b Ac, cA a et a A b est isomorphe à 
RIX, Y, Z| autrement dit, il n’y a pas de polynôme P(X, Y, Z) non nul qui vérifie 
P(bAc,cAa,a/Ab) = 0. 


Démonstration. On montre d’abord le lemme suivant : 
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Lemme 3.3. 
Soient x,y,2 trois réels > 0. Il existe des réels a, a2,b1,b2, C1, c2 tels que l’on aït 
L=bAGy=cCN\aerz = a \0. 


Démonstration. Il suffit de prendre par exemple ai = 1, a2 = 0, bi — box, 
C1 — 0, C2 — —Y. 


Revenons à 3.2 en supposant qu'un polynôme P(X,Y,Z) s’annule sur les 
polynômes b Ac, cA a et a Ab. En vertu de 3.3 ce polynôme serait nul sur (R**)° 
donc serait identiquement nul. 


4. Le cas de GL(2). 


a) Invariants absolus et relatifs. 


Proposition 4.1. 
Les seuls polynômes de R{a, b, c| invariants sous GL(2) sont les constantes. 


Démonstration. Soit P € R{a,b,c] un polynôme homogène de degré d et soit 
h € GL(2) l'homothétie de rapport À £ +1. On a P.h = XŸP, de sorte que P n’est 
invariant par À que si d est nul. 


Rappelons qu’un polynôme P € Rl{a, b, c] est un invariant relatif sous GL(2) si 
pour tout u € GL(2) il existe A(u) € R* tel que P.u = A(u)P. 


Proposition 4.2. 
Les invariants relatifs de R{a, b, c| sous GL(2) sont des polynômes homogènes en 
a, b, c. 


Démonstration. Si P est un tel polynôme, écrit comme somme de polynômes 
homogènes P = P5 +::-+ Pet si on applique l’homothétie h de rapport À £ +1 
on à Ph = P5+ XP; +: + XP; = X(h)P et cela impose que P est homogène. 


La proposition suivante précise le multiplicateur ÀA(u) : 


Proposition 4.3. 


1) L'application u + A(u) est un homomorphisme de groupes de GL(2) dans 
R*. 

2) Le multiplicateur A(u) est une fonction polynomiale des coefficients de la ma- 
trice u. 

3) Il existe un entier n € N tel que À(u) = (dét u)”. 


Démonstration. La première assertion est immédiate et la seconde résulte d’un 
petit calcul d'identification. Pour la troisième, on considère la matrice adjointe u* 
(matrice des cofacteurs), de sorte qu’on a uu* = (détu) Id. Si P est un polynôme 
homogène de degré d, on a donc P.uu* = (détu){P = A(u)X(u*)P, de sorte que 
le polynôme À(u) en les coefficients à, 8,7,8 de la matrice u divise le polynôme 
(aô — By)l. Mais, comme a6 — By est irréductible comme polynôme en a, 8,7, 6, 
X(u) est bien une puissance de dét u = ad — G7. 


Corollaire 4.4. 
Les invariants relatifs de R{a, b, c| sous GL(2) sont les polynômes homogènes en 
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bAc,cA\a et a \b. Pour un tel polynôme homogène de degré d le multiplicateur 
est dét ud. 


Démonstration. En vertu de 4.3.3 les invariants relatifs de GL(2) sont des invari- 
ants absolus de SL(2) donc des polynômes en les invariants élémentaires. 


Proposition 4.5. 


F 
Les fractions rationnelles invariantes sous GL(2) sont de la forme — où F et G 


sont des polynômes en b Ac, ca et a \ b, homogènes de même degré. 


| F , 
Démonstration. Soit — une fraction rationnelle invariante, avec F,G premiers 


G 
F F; 
entre eux. On à donc — — 2 d'où F(G.u) = G(F.u). Comme F divise le 


second membre et est premier avec G il divise Fu. Comme les degrés de F et Fu 
sont égaux on à Fu — A(u)F où À(u) est un scalaire. Autrement dit F (et de 
même G) est un invariant relatif. On conclut avec 4.3. 


Annexe 2 : Le théorème de Bolyai 


Nous montrons dans cette annexe que, pour calculer les aires des polygones, la 
méthode de découpage et recollement, que l’on utilise dès l’école primaire, est 
toujours applicable. 


1. Enoncé. 


Nous appellerons polygone une réunion finie de polygones convexes. On dit qu’une 
réunion de polygones À; (i = 1,---,n) est presque disjointe si les intersections 
A; N À; pour à £ j sont des réunions finies de segments de droites. 

On dit que deux polygones À et B sont équivalents (sous-entendu par découpage 
et recollement) et on note À + B si on peut écrire 


où les À;, B; sont des polygones, où les réunions sont presque disjointes et où, pour 
tout 4, À; et B; sont directement isométriques (ï.e. il existe un déplacement 9; de 
R° tel que g;(4;) = B;). Cela signifie exactement qu’on a découpé À en les 4;, 
qu’on a déplacé ceux-ci (sans les retourner, cf. 4.2) pour obtenir les B; et qu’on a 
recollé les B; pour obtenir B, le tout, bien entendu, sans perte ni chevauchement 
(sauf éventuellement sur les bords). C’est bien la notion usuelle. 

Si G est un sous-groupe du groupe des déplacements, nous préciserons parfois que 
les polygones sont G-équivalents pour signifier que les g; doivent être pris dans 
G. On note <G la relation correspondante. Dans ce qui suit nous utiliserons cette 
notion en prenant pour G le groupe $ engendré par les symétries centrales (c’est- 
à-dire le groupe dont les éléments sont les translations et les symétries centrales). 


Le lemme suivant est laissé au lecteur : 
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Lemme 1.1. 

a) Deux polygones directement isométriques (resp. G-isométriques) sont équivalents 
(resp. G-équivalents). 

b) La relation + (resp. <G) est une relation d'équivalence. 


Il résulte des axiomes des aires et du fait qu’un segment est d’aire nulle que si À et 
B sont équivalents ils ont même aire. La question intéressante est la réciproque : 


Théorème 1.2. 

Soient À et B deux polygones de même aire. Alors À et B sont équivalents par 
découpage et recollement (Bolyai, 1832). On peut même préciser (Hadwiger-Glur, 
1951) qu'ils sont S-équivalents. 


Nous nous contenterons ici de montrer le théorème de Bolyai. La variante 
d'Hadwiger-Glur est plus difficile, même si elle n'utilise que des arguments 
élémentaires. Le lecteur en trouvera une preuve dans [B1] ou [B2]. On montre que 
tout polygone est S-équivalent à un rectangle (un peu comme en 2.1 ci-dessous), 
puis, et c’est le point délicat, que deux rectangles de même aire sont S-équivalents. 


2. Le lemme fondamental. 


Nous allons montrer le lemme suivant : 


Lemme 2.1. 
Soit À un polygone quelconque. Il existe un rectangle R équivalent à À dont un 
côté est de longueur unité. 


Montrons d’abord que ce lemme implique le théorème de Bolyai. En effet, soient 
A et B des polygones de même aire. D’après le lemme, il existe des rectangles R 14 
et Rg, dont un côté est l’unité, et respectivement équivalents à À et B. Comme 
l’aire est conservée par équivalence, les rectangles R1 et Rp ont même aire, donc 
leurs deuxièmes côtés sont égaux. Mais alors on passe de l’un à l’autre par un 
déplacement (mais pas nécessairement un déplacement de S !), donc ces rectangles 
sont équivalents et on a À = R1 = RB = B donc À = B par transitivité. 


3. Preuve du lemme fondamental. 


Notons d’abord qu’il suffit d'établir le lemme 2.1 pour un triangle. En effet, si 
A est un polygone quelconque, on peut toujours l’écrire comme réunion presque 
disjointe de triangles 71,72,---,7,. On peut alors trouver des rectangles À; dont 
un côté est 1 et l’autre /; et qui sont équivalents aux 7;. On obtient un rectangle 
R de côté l, +:--+1, équivalent à À en recollant les À; le long de leurs côtés de 
longueur 1. 


Le pas suivant est de découper un triangle pour en faire un parallélogramme : 


Lemme 3.1. 
Soit T un triangle. Il existe un parallélogramme P tel que T = P. 


Démonstration. Soit ABC le triangle et M et N les milieux de [AB] et [AC]. On 
sait que (MN) est parallèle à (BC). Considérons la symétrie o de centre N. On 
a o(A) = C. Notons D le symétrique de M par rapport à N (cf. figure 6). Alors, 
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la droite (CD) est image de (AM) par ©, donc elle lui est parallèle. Il en résulte 
que le quadrilatère MDCB est un parallélogramme. Le triangle T est réunion du 
triangle AM N et du trapèze MNCB, tandis que le parallélogramme M DCB est 
réunion du même trapèze et du triangle symétrique CDN. On a bien montré que 
le triangle et le parallélogramme sont équivalents. 


. À 
/ \ 
/ | D __.D LC © 
\N D / 4 + 
/ \ / PA 4 
/ Ve F 7 
B C À A V4 B 
Figure 6 Figure 7 


On passe maintenant d’un parallélogramme à un autre, mais dont un côté est 1 : 


Lemme 3.2. 

Soit P un parallélogramme. 

a) Il existe un parallélogramme PF’, dont un côté est de longueur rationnelle, tel 
que P = P'. 

b) Il existe un parallélogramme P", dont un côté est de longueur p, avec p € N*, 
tel que P = P". 

c) Il existe un parallélogramme P"”' dont un côté vaut 1 et tel que P = P". 


Démonstration. a) Soit ABCD le parallélogramme donné et soit D’ € [DC] un 
point tel que la longueur AD’ soit un nombre rationnel. Un tel point existe car 
lorsque D’ varie dans [DC] la longueur AD’ varie dans un intervalle de R, non 
réduit à un point (car un segment n’est pas un arc de cercle !), donc cet intervalle 
contient des rationnels. 


On considère alors le point C” de (DC) tel que DD = CC”, cf. figure 7. Le 
quadrilatère ABC'D' est un parallélogramme. De plus, on passe de ABCD à 
ABC'D' par découpage du triangle ADD’ que l’on recolle, après translation de 
vecteur AB , en BCC’. Enfin, le parallélogramme ABC'D' à un côté rationnel, à 
savoir AD. 


b) Grâce à a) on peut partir d’un parallélogramme ABCD dont le côté AD 


est rationnel. On pose AD — : et on partage le côté AB en q parties égales, 


par des points A6 = À,A:,---,A, — B. On mène alors, par les À;, les droites 
parallèles à (AD) qui coupent (C'D) en des points C;. Ces droites découpent P en 
q parallélogrammes de base AB/q. On transporte alors ces parallélogrammes et 
on les empile sur AA1C1D, cf. figure 8. On obtient bien ainsi un parallélogramme 
dont un côté vaut gAD =pEe N. 


c) On dispose maintenant d’un parallélogramme avec un côté entier, disons 
AD = p. On partage alors [AD] en p parties égales, toutes de longueur 1 par 
des points Ao = À,A1,---, A, — D et on mène les parallèles à (AB) par les A, 
qui recoupent (BC) en les C;. On obtient ainsi p petits parallélogrammes que l’on 
découpe et que l’on transporte pour les mettre, en ligne, à côté de ABC A, cf. 
figure 9. On a bien maintenant un parallélogramme dont un côté vaut 1. 


Preuve du lemme fondamental 25 


Fo 
ON 
PR 
dd 4 
2 FA 
OR 
4 7 
fl A 
DA 
4 : c 
Le A / 
D/Cy QG GC À, 
Re NT 2 
/ / / di / C, 
4 4 4 / S A; 
A ED: / C 
4 y 4 / 1 
A à “B=A , 
1 À À; EM A B 
Figure 8 Figure 9 


Pour en finir avec le lemme 2.1 il ne reste plus qu’à montrer le résultat suivant : 


Lemme 3.3. 
Soit P = ABCD un parallélogramme dont le côté AB vaut 1. Alors P est équiva- 
lent à un rectangle de côté 1. 


Démonstration. On suppose d’abord que le projeté C”’ de B sur la droite (CD) 
est dans le segment [CD]. On considère alors le point D’ tel que GC = DD. 
Le quadrilatère ABC"D' est un rectangle qui s'obtient à partir de ABCD par 
découpage de BCC" que l’on recolle en ADD”. Comme il a un côté égal à AB = 1 
on a gagné. Le raisonnement est identique si le projeté 4’ de À sur (DC) est dans 
le segment [DC. 

Lorsque les deux projetés 4’ et C” sont hors de [CD], on partage AD en n 
parties égales par des points À; et on mène les parallèles à (AB) par les À;. 
Elles recoupent (BC) en C;. On choisit n assez grand pour que le projeté de À 
ou de B sur (AC) soit dans [A1C:1]. La même propriété vaut aussi pour tous les 
petits parallélogrammes empilés sur ABC A:. On peut donc, par le premier cas, 
découper ces parallélogrammes pour en faire des petits rectangles de côté 1, cf. 
figure 10. Il ne reste plus qu’à empiler les rectangles obtenus et on a gagné. 


A .D C 


[ À, Ï C, Figure 10 


Remarques 3.4. 

1) On peut montrer un théorème analogue avec des unions disjointes au lieu de 
presque disjointes, voir le joli livre de Marc Guinot [G|. 

2) On notera que la démonstration ci-dessus fait un usage essentiel de l’axiome 
d’Archimède. On peut montrer que le théorème n’est pas vrai sur un corps non 
archimédien. 
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4. Quelques problèmes. 


Le théorème de Bolyai assure donc qu’on peut toujours trouver un puzzle pour 
passer d’un polygone à un polygone de même aire (et il fournit un algorithme). Une 
question souvent plus amusante est de trouver le puzzle le plus simple possible. 
Voici deux exemples de tels problèmes : 


1) On se donne un carré. Produire un puzzle pour le transformer en deux carrés, 
en trois carrés. 

2) Il était une fois un pâtissier, féru de géométrie, mais distrait. Il possédait un 
moule à tarte en forme de triangle scalène (c’est-à-dire un triangle quelconque 
donc non isocèle). Pour faire sa tarte il en mesura les trois côtés, réalisa la pâte 
aux mesures et la couvrit de fruits. Hélas, il s’aperçut alors que le triangle qu’il 
venait de réaliser n’était pas le bon, mais son symétrique par rapport à une droite. 
Sauf à faire une tarte à l’envers il ne pouvait donc mettre sa tarte dans le moule. 
Comme il connaissait le théorème de Bolyai il se mit en quête d’un découpage lui 
permettant de rattraper sa bévue. Pouvez-vous l’aider ? 


